AMD Instinct (문단 편집)

=== gfx906 / CDNA 1 마이크로아키텍처 ===
||<table align=center><tablebgcolor=#007c97>[youtube(ulRHTMLnte4)] ||
|| {{{#white '''AMD Instinct MI100 가속기 소개 영상'''}}} ||

{{{#!wiki style="word-break: keep-all"
||<-21><tablealign=center><tablebordercolor=#007c97><bgcolor=#007c97><color=white> GPU별 최대 내부 구성 요소 ||
||<rowcolor=white><rowbgcolor=#007c97> GPU[br]이름 || 공정[br]^^(㎚)^^ || 면적[br]^^(㎟)^^ || HWS || ACE || GP || SE || PU || RZ || CU || SP[br],,(FP32),,[br]^^(INT32)^^ || SU || RA || TFU || LDS[br]^^(KB)^^ || L1[br],,캐시,,[br]^^메모리^^[br]^^(KB)^^ || L2[br],,캐시,,[br]^^메모리^^[br]^^(MB)^^ || GDS[br]^^(KB)^^ || RB || ROP || MC[br],,(bit),,[br]^^(채널)^^ ||
||<-21><bgcolor=#003d4c><color=white> '''CDNA''' ||
||<colbgcolor=black><colcolor=#007c97>'''Arcturus''' || 7 || 750 || 1 || 4 || - || 8 || - || - || 128 || 8192 || 128 || - || - || 64×128 || 16×128 || 8 || 64 || - || - || 1024×4 ||
}}}

{{{#!wiki style="word-break: keep-all"
||<-7><tablealign=center><tablebordercolor=#007c97><bgcolor=#007c97><color=white> GPU별 특성 ||
||<rowcolor=white><rowbgcolor=#007c97> GPU[br]이름 || 그래픽[br]가속 || GPGPU[br]가속 || 비디오[br]가속 || 호스트[br]인터페이스 || 메모리[br]규격 || 디스플레이[br]출력 ||
||<-7><bgcolor=#003d4c><color=white> '''CDNA''' ||
||<colbgcolor=black><colcolor=#007c97>'''Arcturus''' || - || OpenCL 2.0 || VCN 2.5 || PCIe 4.0 ×16 || HBM2 || - ||
}}}

{{{#!wiki style="word-break: keep-all"
||<table align=center><tablebordercolor=#007c97><rowbgcolor=#007c97><rowcolor=white><|2> 가속기[br]모델명 ||<-4> GPU ||<-4> GPU 외부 메모리 ||<|2> TGP[br]^^(W)^^ ||<|2> 출고[br]가격[br]^^($)^^ ||
||<rowbgcolor=#007c97><rowcolor=white><|1> 코드네임[br],,(공정),,[br]^^(면적)^^ ||<|1> SP[br]^^(ACE, SU)^^ ||<|1> 클럭[br]^^(부스트)^^[br]^^(MHz)^^ ||<|1> L2[br]캐시[br]^^메모리^^[br]^^(MB)^^ ||<|1> 버스[br]^^(bit)^^ ||<|1> 규격 ||<|1> 클럭[br]^^(비트레이트)^^[br],,(MHz),,[br]^^(Mbps)^^ ||<|1> 용량[br]^^(GB)^^ ||
||<colbgcolor=black><colcolor=#007c97>'''MI100''' || Arcturus[br],,(7 ㎚),,[br]^^(750 ㎟)^^ || 7680[br](4, 120) || 1000[br](1502) || 8 || 4096 || HBM2 || 1200[br](2400) || 32 || 300 || 6400 ||
||<bgcolor=#007c97><color=white><-11><)>{{{#!folding 【용어 전체 이름 펼치기 · 접기】
,,Asynchronous Compute Engine = ACE[br]Stream Processor = SP[br]Scalar Unit = SU[br]Total Board Power = TBP,,}}} ||
}}}

2020년 11월 16일에 발표된 컴퓨팅 카드로, NVIDIA가 A100부터 TESLA 브랜드 네임을 삭제했던 것처럼 AMD도 이때부터 라데온 브랜드 네임을 삭제하고 인스팅트만 남게 되었다. AMD가 2020년 3월 파이낸셜 데이를 통해 게이밍은 RDNA, 컴퓨팅은 CDNA로 분화할 것을 약속했기 때문에 연산 특화 목적에 맞게 그래픽스 관련 기능들이 전부 삭제되었다. 그 대신 비디오 디코딩, 인코딩 기능만 존속되어 동영상 가속을 활용할 수 있다. 또한 새로운 하드웨어로 NVIDIA의 TensorCore와 비슷하게 행렬 연산을 하는 매트릭스 코어가 추가되었다.

이전 세대 최상위 라인이었던 MI60 대비 FP32 연산 성능이 1.5배 향상되어, 먼저 나온 경쟁사의 A100보다 약 20% 높은 FP32 연산 성능을 보여준다.[* 그래봤자 NVIDIA의 최상위 그래픽카드인 A6000보다 33%나 낮은 성능을 보인다. 문제는 A6000이 출시가가 10배 정도 비싸다는 것(...) 그래서 별 의미는 없다.] 하지만, 메모리 대역폭이 MI60 대비 1.2배 향상에 그쳐서 실성능은 메모리 성능 병목으로 1.5배가 안 될 확률이 높다. 문제는 같은 시기에 경쟁사가 기존 A100의 메모리 규격을 HBM2에서 HBM2E로 업그레이드해서 메모리 대역폭이 약 30% 더 빨라진 개선판을 내놓았다는 점.
안 그래도 메모리 대역폭이 약 1.23 TB/s라서 1.56 TB/s인 기존 A100 대비 약 20% 넘게 느렸는데, HBM2E 버전의 등장으로 약 2.04 TB/s 대역폭이 구현됨에 따라 40% 넘는 격차로 벌어졌다. 결과적인 절대 성능면에서는 A100을 넘는데 실패했다고 볼 수 있으며, 결국 A100보다 절반 가까이 저렴한 가격으로 승부 해야 할 것으로 보인다.--[[AMD]]도 이걸 알았는지 자기네 페이지에는 부동소수점 연산 성능만 적어놨다--

저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,
기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.
이 동의는 철회할 수 없습니다.

AMD Instinct (문단 편집)

캡챠